Pinecone が提供している RAG 機能 Pinecone Assistant を試してみる

サーバレスかつ良いモデルを使いたいの2軸でかなり尖ってる印象です。

#Pinecone

#生成AI

たかくに

2024.09.30

こんにちは！AWS 事業本部コンサルティング部のたかくに（@takakuni_）です。
今回はタイトルの通り、 Pinecone Assistant を試してみます。
!Pinecone Assistant は現在パブリックプレビューです。 GA のタイミングで仕様変更を伴う可能性があります。
 Pinecone Assistant 機能とはPinecone Assistant は Pinecone が提供する RAG のサービスです。RAG に登録したいドキュメントをコンソール or Pinecone SDKs 経由アップロードすることで、エンべディング、ベクトルデータベースへの保管をマネージドに行ってくれます。
RAG に対する質問/回答生成も、コンソール or Pinecone SDKs 経由で操作可能で Pinecone で RAG を完結できる機能です。
AWS でいうところの Amazon Q for Business に近しい存在でしょうか。
How it works

When you upload a document, your assistant processes the contents by chunking and embedding the text. Then, the assistant stores the embeddings in a vector database. When you chat with your assistant, it queries a large language model (LLM) with your prompt and any relevant information from your data sources. With this context, the LLM can provide responses grounded in your documents.
Assistant manages embedding generation and storage and prompting the LLM: you do not directly access these parts of the system. You upload the files and chat with the model, and Assistant manages all other components.
https://docs.pinecone.io/guides/assistant/understanding-assistant
 ドキュメント形式続いてアップロード可能なドキュメント形式です。
マネージドな RAG の立ち位置あるため、ドキュメントの形式は .txt, .pdf のみ対応しています。非対応の形式の場合は事前に形式変換処理が必要ですね。
その他の制限事項については以下をご覧ください。
https://docs.pinecone.io/guides/assistant/understanding-assistant#limitations
https://docs.pinecone.io/guides/assistant/upload-file#limitations
 モデルがすごいここが真骨頂です。Amazon Q for Business と違い、回答生成のモデルを選べます。
なんと、回答生成には OpenAI 社の GPT-4o と Anthropic 社の Claude 3.5 Sonnet が使えます。逆にこの 2 つのみサポートしています。尖り具合、凄くないですか。
https://docs.pinecone.io/guides/assistant/chat-with-assistant#choose-a-model-for-your-assistant
どのクラウドにも左右されない、3rd Party ならではの強みだと思います。
 やってみるそれでは Pinecone Assistant を利用して、RAG を体験してみます。
今回は桃太郎を使って RAG を構築してみます。
Pinecone SDKs もありますが、今回は温もりのあるコンソールでぽちぽちと。
Pinecone のプランは Standard Plan を利用します。サブスクリプションの紐付け等はスキップします。
https://aws.amazon.com/jp/blogs/news/leveraging-pinecone-on-aws-marketplace-as-a-knowledge-base-for-amazon-bedrock/
 アシスタントの作成まずはアシスタントの作成を行います。 Assistants から Create an assistant をクリックします。
名前は momotarou とします。
 データのアップロードアシスタントを作成すると、早速ファイルアップロード画面に移ります。
今回は以下のドキュメントをアップロードします。
https://github.com/takakuni-classmethod/genai-blog/tree/main/サンプルドキュメント/momotarou
ファイルをアップロードすると、このようなインポート画面になります。複数ファイルをアップロードできるのはとっても便利ですね。
アップロードしてみると、なんと失敗してしまいました。
調べてみて気がついたのですが、ファイル名は英語で記載する必要がありました。以下は中身は日本語ですが、ファイル名変更によって成功している例です。
 プロンプトを投げる最後に質問してみましょう。
エンべディングモデルやベクトルデータベースの話はないままここまで来ました。マネージド感が凄まじいですね。
質問をしてみましたが、適した回答が返ってきています。（引用付きで）
また、評価ボタンもついています。（おそらく、チャンク化が望ましいものだったかを、フィードバックするのではないかと予想されます。）
なお、モデルの切り替えは設定アイコンから可能です。
 料金パブリックプレビュー段階ですが、Standard プランだと次の料金形態です。
日別あたりの料金（月額換算で 6 USD）はあるものの、その他の観点では非常にサーバレスな作りとなっています。
ストレージ：1GB あたり月 3USD
入力トークン：100 万トークンあたり 8 USD
出力トークン：100 万トークンあたり 15 USD
1 日あたり 0.2 USD
https://www.pinecone.io/pricing/
 まとめ以上、「Pinecone Assistant を試してみる」でした。
非常にシンプルな作りの一方、サーバレス、利用可能なモデルの尖り具合がすごくて、刺さる人には刺さるのではないでしょうか。
GA が非常に期待できますね。このブログがどなたかの参考になれば幸いです。
AWS 事業本部コンサルティング部のたかくに（@takakuni_）でした！